首页> 外文OA文献 >A method for constructing a confidence bound for the actual error rate of a prediction rule in high dimensions
【2h】

A method for constructing a confidence bound for the actual error rate of a prediction rule in high dimensions

机译:一种用于构建高维预测规则的实际错误率的置信区间的方法

代理获取
本网站仅为用户提供外文OA文献查询和代理获取服务,本网站没有原文。下单后我们将采用程序或人工为您竭诚获取高质量的原文,但由于OA文献来源多样且变更频繁,仍可能出现获取不到、文献不完整或与标题不符等情况,如果获取不到我们将提供退款服务。请知悉。

摘要

Constructing a confidence interval for the actual, conditional error rate of a prediction rule from multivariate data is problematic because this error rate is not a population parameter in the traditional sense—it is a functional of the training set. When the training set changes, so does this “parameter.” A valid method for constructing confidence intervals for the actual error rate had been previously developed by McLachlan. However, McLachlan's method cannot be applied in many cancer research settings because it requires the number of samples to be much larger than the number of dimensions (n >> p), and it assumes that no dimension-reducing feature selection step is performed. Here, an alternative to McLachlan's method is presented that can be applied when p >> n, with an additional adjustment in the presence of feature selection. Coverage probabilities of the new method are shown to be nominal or conservative over a wide range of scenarios. The new method is relatively simple to implement and not computationally burdensome.
机译:从多元数据中为预测规则的实际,条件错误率构建置信区间是有问题的,因为从传统意义上讲,该错误率不是总体参数,而是训练集的功能。当训练集更改时,此“参数”也会更改。麦克拉克伦(McLachlan)先前已经开发出一种有效的方法来构造实际误差率的置信区间。但是,McLachlan的方法不能应用于许多癌症研究环境,因为它需要的样本数量要比维数(n >> p)大得多,并且它假定不执行降维特征选择步骤。在此,提出了McLachlan方法的替代方法,该方法可以在p >> n时应用,并在存在特征选择的情况下进行附加调整。在许多情况下,新方法的覆盖率概率都是名义上的或保守的。该新方法实现起来相对简单,并且在计算上不麻烦。

著录项

  • 作者

    Dobbin, Kevin K.;

  • 作者单位
  • 年度 2008
  • 总页数
  • 原文格式 PDF
  • 正文语种 en
  • 中图分类

相似文献

  • 外文文献
  • 中文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号